[新機能プレビュー] Amazon Q in QuickSight Scenarios を日本語で試してみた
コーヒーが好きな emi です。
以下ブログで現在パブリックプレビュー中の Amazon Q in QuickSight Scenarios で新規シナリオの作成をやってみました。以下ブログでは英語の自然言語で問い合わせを行ったので、本記事では日本語で回答が得られるか試してみました。
最初に所感
英語以外の言語への対応がまだのため、日本語で問い合わせると結果が返ってきにくいです。
私が試した範囲では、日本語で問い合わせるとそれっぽい回答を得られることはありますが、回答が英語だったり、表記揺れや誤記があったりします。
明確に「日本語で回答してください」とプロンプトで指示すると日本語で回答してくれることもありますが、回答が不足していることがあります。
別スレッドで日本語による問い合わせを行う
[新機能プレビュー] Amazon Q in QuickSight Scenarios でアップロードした CSV ファイルに自然言語(英語)で質問し AI によるインサイトを得てみた | DevelopersIO で作成済みの既存のシナリオから別のスレッドを生やします。
既存のシナリオは Amazon Q in QuickSight でトピックを作成しデータセットに Q&A してみた | DevelopersIO で使った「部署ごとに保持しているお菓子の在庫」を記載した CSV ファイルをアップロードして作成しています。
日本語で「課ごとのドーナツの個数」と入力して SUBMIT しました。
1 分程 待ちます。
回答が得られました。日本語で問い合わせたのですが、回答は英語になってしまいました。しかし、英語でちゃんとドーナツの個数とグラフを回答してくれており、適切な回答が得られていると思います。
The DynamoDB課 (section) has the highest donut consumption with 67 donuts, followed closely by EFS課 with 66 donuts. RDS課, FSx課, and S3課 round out the top five with 40, 30, and 24 donuts respectively.
(機械翻訳)DynamoDB課(セクション)のドーナツ消費量は67ドーナツで最も多く、僅差でEFS課が66ドーナツで続く。RDS課が40ドーナツ、FSx課が30ドーナツ、S3課が24ドーナツでトップ5を占めています。
Modify block でブロック内の回答を日本語に編集
Modify block でブロック内の回答を編集してみます。日本語で「課ごとのドーナツの個数を日本語で教えてください。」と入力して APPLY してみました。
30 秒ほどで回答が得られました。なんと、日本語で回答を得られました。
先ほどの回答と比べると、表示されている課の数が減っています。
スレッドを続ける
更にスレッドを続けていきます。「+」を押して新たな質問の提案を受けると、なんと提案も日本語で表示してくれました。
提案された中から、「課のステータスとスナック消費量の間に関係はありますか?」を選択して SUBMIT します。
推論の途中経過
30 秒ほど経過。
1 分ほど経過。
2 分ほど経過。
3 分ほど経過。
4 分ほどで結果が表示されました。日本語と英語が混じっています。ステップごとに何をしているかの途中経過は日本語になっていて、実際の分析結果部分は英語になっているようです。
Step 1: まず、各ステータス(状態)ごとにスナックの平均消費量を計算します。
There appears to be a relationship between status and snack consumption. For example, the "超ごきげん" (super good mood) status has the highest total snack consumption at 60.6 items, while the "不調" (not feeling well) status has the lowest at 39.1 items.
(機械翻訳)ステータスとおやつ消費量には関係があるようだ。例えば、「超ごきげん」は60.6品目と最も多く、「不調」は39.1品目と最も少ない。
超ごきげんな部署はお菓子の保持量が多いと述べられています。ちなみに、私がそうなるように意図的にデータを作成したので、この認識は大体あっています。
棒グラフの横軸を見ると、横軸の並べ方も少し気になります。悪い方から順番に
不調
↓
普通
↓
ごきげん
↓
超ごきげん
と並んでいてほしいのですが、そうなっておらず、なぜか「ごきげん」と「ご機嫌」という表記で項目が分かれています。元の CSV データに「ご機嫌」と漢字で書いた部分は無いのですが。
Step 2: 統計的な分析を行い、ステータスとスナック消費量の間に有意な関係があるかどうかを調べます。前回の分析方法をさらに調整し、より適切な統計手法を使用します。
Still analyzing... Hang tight...
Still analyzing... Hang tight...
Still analyzing... Hang tight...
We need additional information to fully address your request. You can try editing the block through popover.
(機械翻訳)お客様のご要望に完全にお応えするには、追加情報が必要です。ポップオーバーからブロックを編集してください。
回答するには更に情報が必要で、ブロックを編集するように言われています。
では、言われた通りブロックを編集してみましょう。今度はもう少し具体的に、「Status 列と donut 列の相関を分析してください。」と入力して SUBMIT しました。
推論の途中経過
1 分程経過。
2 分程経過。
3 分ほどで結果がでました。
▼結果は先ほどと同様、ステップごとに何をしているかの途中経過は日本語になっていて、実際の分析結果部分は英語になっているようです。
Step 1: まず、各ステータスごとのドーナツの平均消費量を計算します。
Still analyzing... Hang tight...
The analysis shows a moderate positive correlation (0.48) between status and donut consumption. People with better moods tend to eat more donuts, with the "超ごきげん" (super happy) status associated with the highest average donut consumption of 21.6 donuts, while those in "不調" (poor condition) eat the least, averaging 1.1 donuts.
(機械翻訳)分析によると、ステータスとドーナツ消費量の間には中程度の正の相関関係(0.48)が見られた。超ごきげんの人は平均21.6個と最も多く、不調の人は平均1.1個と最も少ない。
相関関係が「0.48」と数値で表示されていて本格的です。
▼ドーナツの消費量が多い時は良い気分である、という関係性があると述べられています。
Step 2: 各ステータスのドーナツ平均消費量を棒グラフで視覚化します。
The visualization clearly illustrates the relationship between mood status and donut consumption, reinforcing our previous observation that better moods are associated with higher donut consumption
(機械翻訳)この視覚化は、気分の状態とドーナツ消費量の関係を明確に示しており、より良い気分はより高いドーナツ消費量と関連するという我々の以前の観察を補強している。
▼ クラスカル・ウォリス検定(Kruskal-Wallis test)という統計手法を用いて分析してくれていますが、 p 値という確率データが不正な値になってしまったため、計算もしくはデータに不備があると述べています。
Step 3: ステータス間でドーナツ消費量に統計的に有意な差があるかどうかを分析します。
Still analyzing... Hang tight...
Still analyzing... Hang tight...
The Kruskal-Wallis test suggests a statistically significant difference in donut consumption among different statuses. However, the negative p-value (-2.9710) is invalid, indicating a potential issue with the test implementation or data. Further investigation or a different statistical approach may be needed for accurate conclusions.
(機械翻訳)クラスカル・ワリス検定は、異なるステータス間のドーナツ消費量に統計的に有意な差があることを示唆している。しかしながら、負のp値(-2.9710)は無効であり、検定の実施またはデータに潜在的な問題があることを示している。正確な結論を得るためには、さらなる調査または別の統計的アプローチが必要かもしれない。
最下部にクラスカル・ワリス検定の計算結果らしき表があります。私は統計に明るくないのでこの表の意味は分からないのですが、横にスクロールする必要があってちょっと見難いですね。ブロックを横に広げようとしましたが、ブロックの大きさは変えられないようでした。
多言語対応に関するコミュニティのやり取り
以下の QuickSight コミュニティのやりとりでは、QuickSight Q のドイツ語への対応を実現するアーキテクチャの提案と要望が上がっています。
以下のように、しばらくは英語での開発に注力する旨がやり取りされていました。
Our focus for the time being is on making a fast, simple, and powerful Q experience in English.
(機械翻訳)当面は、迅速かつシンプルでパワフルなQ体験を英語で提供することに重点を置く
こちらのやりとりは 2022 年のものなので現在はまた状況が変わっている可能性もあるかもしれません。
ちなみに 2024/12/19 に Amazon Q in Connect が日本語を含む 64 言語をサポートしました。
Q in QuickSight も多言語対応待ってます!!!
終わりに
繰り返しとなりますが、英語以外の言語への対応がまだのため、日本語で問い合わせると結果が返ってきにくいです。
私が試した範囲では、日本語で問い合わせるとそれっぽい回答を得られることはありますが、回答が英語だったり、表記揺れや誤記があったりします。
明確に「日本語で回答してください」とプロンプトで指示すると日本語で回答してくれることもありますが、回答が不足していることがあります。
Q in QuickSight の GA 済みの他の機能も日本語で問い合わせると同じ感じです。
日本語対応はまだなので、たくさんフィードバックして対応を待ちましょう。